干货分享 | 什么是复杂网络的“优先连接”现象?
The following article is from 人文地理霞客行 Author 鲁迅也很奇怪
编者按
网络与空间、地方、尺度、区域、景观等术语一样重要,是人文地理学研究的核心概念。网络的类型有很多种,如铁路线、公路线这种实体网络,也有如创新合作、熟人关系这种社会网络。网络对人文地理研究的重要性在于,把复杂的社会空间关系抽象化为拓扑关系,更好呈现地理现象的形成过程、机制与格局。复杂网络中常常存在强者越强的现象,本篇推文从优先连接的角度解释这一现象的形成机制。
从生活现象说起
人之道,损不足以奉有余。
图片来源:https://what-if.xkcd.com/118/
人类社会到处都是强者越强的现象:
一个城市的发展水平越高,越可能吸引到更多的人才;而大量的小城镇则很难吸引到人,有的甚至还存在人口收缩。
一个企业家越有钱,越可能通过投资组合稳步获得更多收益;而笔者则只能长期挣扎在贫困线上下。
一个游戏的玩家越多,越可能通过口口相传吸引到更多玩家;而笔者所喜爱的二战射击游戏Heroes and Generals则经常匹配不到人。
为什么?
从网络的角度看,这些现象都可以用“优先连接”(preferential attachment)来解释。它指的是进入一个网络的新节点倾向于与节点度高的节点相连接。反过来说,一个节点如果已经接受了很多连接,那么它就越容易被新来的节点所连接。例如,我们可以生成一个节点:
然后每一步都生成一个新的节点,并让它连接到已有的网络中:
这里我们遵循了优先连接的原则,因此新加入的节点都倾向于连接到节点度较高的节点上,也就是具有“先发优势”的1号节点:
不过,优先连接并不是指所有的新节点都简单地与节点度最高的那个节点相连接,它关注的是一个概率问题。比如6号节点并没有连接到节点度为4的1号节点,而是连接到了节点度为1的4号节点:
如果继续增加节点,我们就可以更好地观察这个网络的特征。当增加到20个节点时,网络呈现以下形态:
可以看出,围绕1号节点形成了一个星型结构,有8个节点都被它吸引,呈众星拱月之势。4号节点有一定的吸引力,但和1号比起来相形见绌。7号和3号次之。剩下的那些节点的入度最多为1,有些一个粉丝也没有。为了更好地分析这个网络的形态和性质,可以继续生成一个有1000个节点的网络:
这个网络很像树枝的形状,能看出来比较明显的自相似性。每个大树杈都分出来小树杈,小树杈又分出更小的树杈……,而且不同大小的树杈之间在形态上都比较相似。可以分析一下度的分布,来做进一步观察。下面第一个是原值的散点图,第二个是取对数后的散点图:
很明显,这里生成的是一个无标度网络(scale-free network),也就是节点度服从幂律分布的网络。它呈现很明显的强者越强、弱者越弱的特征,第一名很厉害,后面几名的节点度迅速下降,然后趋于平缓。取对数后表现为一条直线。
这样的网络在现实中随处可见。除了前面提到的例子外,更直观的是微博的社交网络。明星和大V可以有上千万粉丝,而笔者这种小白可能只有几个粉丝(还包括营销号和自己的小号)。又如,在城市之间的快递流通当中,总是有少数的城市向全国发出了大部分的快递,在这个网络中承担重要的中转功能。
图片来源:李鲁奇,马学广.基于运单数据的中国快递型物流网络格局、结构与功能——以宅急送为例[J].地理科学,2019,39(1):89-97.
可以看出,网络无标度性的形成有两个基本的要素:一是网络生长,也就是新的节点加入网络的过程;二是网络生长过程当中的优先连接。比如,微博网络之所以出现无标度特征,一方面是因为新用户源源不断地注册微博,另一方面系统也不厌其烦地推荐新用户关注明星和大V。
优先连接的起源
优先连接现象最早是在1925年,由英国统计学家George Udny Yule研究的。后来科学计量之父Derek J. de Solla Price在1976年也研究了这一现象,并把它叫做积累优势(cumulative advantage)。不过,描述优先连接最著名的模型是Albert-Laszlo Barabasi和Reka Albert提出的,所以也被叫做Barabási–Albert模型或BA模型。它的基本形式非常简明:一个新的节点i连接到网络里某个已有节点j的概率,就是节点j的度占全部已有节点的度之和的比重。
这个也是前面生成网络的时候所遵循的公式。虽然看上去很简单,但是因为无标度性是现实世界中复杂网络的一个重要特征,因此这个概念对于理解复杂网络的形成机制很有价值。另外在后来的研究中,也有很多针对这个模型的扩展和应用。例如在地理学领域内,Sandra Vinciguerra等就在这个公式的基础上进行了一些扩展,主要加入了距离d、边界γ两个地理变量:
然后用这个模型模拟了城市之间的互联网网络(下图第一个是观测网络,第二个是模拟网络)。由于参数是人为选择的,所以模拟精度还有待提高,但这个思路对于理解城市网络的形成机理很有价值。
图片来源:参考文献3
不过总体来看,笔者认为,优先连接虽然比较好地解释了无标度网络形成的动力机制,但这种机制比较抽象,本质上还是一种对网络形成过程的描述。尤其是在分析人文地理学和社会科学的具体问题时,还要进一步回答,为什么新的节点会偏好节点度高的节点。例如,在各种城市网络中,集聚和规模效应、城市的声望、行政力量等,都可能使少数高等级城市吸引到来自大量城市的连接。又如对于微博网络来说,为什么新用户都去粉明星和大V而非笔者的这种小号?微博的推荐机制、明星和大V自身的吸引力、发博的数量和质量等都可以作为解释。
网络的优先连接的生活启示
笔者认为最大的启示,就是学习要趁早,积累先发优势。如果能较早进入一个新的研究领域,即使一开始研究不够深入,最后也很有可能成为大佬。不过前提是,要选择一个存在“网络生长”的领域,也就是很有潜力、能吸引人一直进来的领域。
如果不具备积累先发优势的条件,也可以先人为地提高“节点度”,再利用优先连接的机制。比如为了骗赞,可以用小号把自己赞一遍,一旦赞数足够多,成为度高的节点,其他人自然就会跟着点赞(不适用于所有平台)。淘宝卖家刷单、贴吧骗回复同理。
不过,要提高自己的节点度和对新节点的吸引力,归根到底还是要靠提升自己的能力。无论对于各位大佬还是笔者这样的小白来说,关注优质公众号都是提升自己能力的一个重要途径。比如“人文地理霞客行”这个公众号,目前已经有数百名粉丝,正在成为地理学自媒体中炙手可热的一颗闪耀明星。笔者通过关注这个号,就了解到大量的前沿理论、学术咨询和生活感悟,对自己的学习和生活均大有裨益。
参考文献
[1]Barabasi A, Albert R. Emergence of Scaling in Random Networks[Z]. American Association for the Advancement of Science, 1999: 286, 509-512.
[2]Bonacich P, Lu P. Introduction to Mathematical Sociology. Princeton University Press, 2012.
[3]Vinciguerra S, Frenken K, Valente M. The Geography of Internet Infrastructure: An Evolutionary Simulation Approach Based on Preferential Attachment. Urban Studies, 2010, 47(9): 1969-1984.
转载自:人文地理霞客行
经作者授权转载
文章仅代表作者观点,与本公众号无关,版权归原作者所有
原文标题:
什么是复杂网络的“优先连接”现象?
图文编辑:安静
责任编辑:康楠
审编:王波涛 李倩
终审: 顾伟男 田巍 梁龙武
猜你喜欢
扫描二维码,关注我们
都看到这里了,点个“在看”再走呗~👇